Το πακέτο φιλοξενείται στο προσωπικό αποθετήριο του σπουδαστή στο github. Για να εγκατασταθεί το DasyMapR θα πρέπει καταρχήν να εγκατασταθεί το πακέτο devtools και στην συνέχεια με την χρήση της συνάρτησης install_github() να γίνει η εγκατάσταση του πακέτου
install.packages("devtools")
library(devtools)
install_github("etsakl/DasyMapR", build_vignettes = TRUE)
library(DasyMapR)Περισσότερες πληροφορίες για το πακέτο θα μπορούσε να βρει κάποιος στα file του πακέτου help("DasyMapR") ή στο github
Το πακέτο της R που αναπτύχθηκε περιέχει μία σειρά εργαλείων που μπορούν να βοηθήσουν το χρήστη να αποδώσει τα δεδομένα στο ETRS-LAEA κάναβο αλλά και να αποσυσσωματώση δεδομένα με την χρήση βοηθιτικής επιφάνειας. Θα παρουσιαστούν κάνοντας χρήση σημειακών δεδόμενων που σχετίζονται με τις αιτήσεις που γίνονται στο ΕΑΠ με σκόπο τη συμμετοχή στις διαδικασιες επιλόγής φοιτητών του ιδρύματος. Με την χρήση των εργαλέιων που αναπτύχθηκαν αλλά και με την χρήση άλλων πακέτων της R θα γίνει προσπάθεια κατανομής των δεδομένων στο γεωγραφικό κάναβο ETRS (θα περιοριστούμε σε αυτήν την εργασία μόνο στις αιτήσεις που έγιναν απο φοιτητές που δηλώνουν κατοικία στην Ελλάδα) και στην συνέχεια θα συσχετιστουν με άλλα δεδόμενα από άλλες πηγές. Εδώ για λόγους που σχετίζονται με την προστασία των πρόσωπικών δεδόμενων των χρηστών εμφανίζεται και χρησιμοποιήται μόνο o Ταχυδρομικός Κώδικας, η χώρα και ο νομός. Εξετάζονται τα δεδομένα.
Είναι αναμενομένο, όσες ασφαλιστικές δικλείδες και αν προβλεφθούν κατα την εισαγωγή δεδομένων απο τους χρήστες που συμπληρώνουν π.χ αιτήσεις, ότι θα υπάρξουν εγγραφές που δεν μπορούν να χρησιμοποιθουν χώρις επεξεργασία. Εν προκειμένω μία “δειγματοληπτική” προεπισκόπιση αποδεικνύει τον ισχυρισμό.
data("candidates_addresses")
candidates_addresses <- candidates_addresses[order(candidates_addresses$country),
]
kable(head(candidates_addresses, 10))| country | num | pre | street | zipCode | city | |
|---|---|---|---|---|---|---|
| 556 | country | 0 | pre | street | zipCode | city |
| 789 | country | 0 | pre | street | zipCode | city |
| 3627 | country | 0 | pre | street | zipCode | city |
| 3875 | country | 0 | pre | street | zipCode | city |
| 7425 | country | 0 | pre | street | zipCode | city |
| 9963 | country | 0 | pre | street | zipCode | city |
| 10086 | country | 0 | pre | street | zipCode | city |
| 10983 | country | 0 | pre | street | zipCode | city |
| 11481 | country | 0 | pre | street | zipCode | city |
| 11780 | country | 0 | pre | street | zipCode | city |
kable(candidates_addresses[round(runif(10, min = 11, max = nrow(candidates_addresses) -
10), 0), ])| country | num | pre | street | zipCode | city | |
|---|---|---|---|---|---|---|
| 945 | Ελλάδα | 0 | KAS | ΓΡΑΜΜΟΥ | 52100.0 | ΚΑΣΤΟΡΙΑ |
| 249720 | Ελλάδα | 0 | BOI | ΝΙΚΟΛΑΟΥ ΓΕΩΡΓΑΛΗ | 32200.0 | ΘΗΒΑ |
| 2444 | Ελλάδα | 0 | AXA | ΑΧΕΡΟΝΤΟΣ | 26442.0 | ΠΑΤΡΑ |
| 292278 | Ελλάδα | 0 | ROD | ΔΗΜΟΚΡΑΤΙΑΣ | 69100.0 | ΚΟΜΟΤΗΝΗ |
| 456606 | Ελλάδα | 0 | ATT | ΡΗΓΑ ΦΕΡΑΙΟΥ | 176 71 | ΚΑΛΛΙΘΕΑ |
| 122838 | Ελλάδα | 0 | ATT | ΠΑΠΑΡΡΗΓΟΠΟΥΛΟΥ | 15452.0 | ΑΘΗΝΑ |
| 227877 | Ελλάδα | 0 | AXA | ΔΥ | 26500.0 | ΚΑΡΥΑ ΠΑΤΡΑ |
| 513096 | Ελλάδα | 0 | ATT | ΑΡΧΑΙΑΣ ΙΛΙΔΟΣ | 19007 | ΜΑΡΑΘΩΝΑΣ |
| 571243 | Ελλάδα | 0 | ATT | ΙΠΠΟΚΡΑΤΟΥΣ | 14452 | ΜΕΤΑΜΟΡΦΩΣΗ |
| 525176 | Ελλάδα | 0 | THS | Ι ΤΣΕΛΕΠΗ | 54352 | ΘΕΣΣΑΛΟΝΙΚΗ |
kable(tail(candidates_addresses, 10))| country | num | pre | street | zipCode | city | |
|---|---|---|---|---|---|---|
| 139796 | Τυνησία | 0 | NGR | AMBASSADE DE GRECE RUE SAINT FULGENCE NOTREDAME | 1082.0 | ΤΥΝΙΔΑ |
| 165025 | Τυνησία | 0 | NGR | AMBASSADE DE GRECE RUE SAINT FULGENCE NOTREDAME | 1082.0 | ΤΥΝΙΔΑ |
| 215423 | Φινλανδία | 0 | NGR | RAJAPYYKINTIE | 90650.0 | OULU |
| 372669 | Φινλανδία | 0 | NGR | UNIONINKATU | 00170 | HELSINKI |
| 777881 | Φινλανδία | 0 | NGR | HAUHONTIE | 00550 | HELSINKI |
| 780455 | Φινλανδία | 0 | NGR | HAUHONTIE | 00550 | HELSINKI |
| 518971 | ΧΑΛΑΝΔΡΙ | 0 | ||||
| 665446 | ΧΑΛΑΝΔΡΙ | 0 | ||||
| 170904 | Χονγκ-Κόνγκ | 0 | ATT | ΚΩΝΣΤΑΝΤΟΠΟΥΛΟΥ | 14233.0 | ΑΘΗΝΑ |
| 216045 | Χονγκ-Κόνγκ | 0 | ATT | ΑΝΤΙΓΟΝΗΣ | 104-43 | ΑΘΗΝΑ |
Είναι πρόφανές ότι τα δεδόμενα απαιτούν προετοιμασία για να χρησιμοποιηθούν. Η προετοιμάσία των δεδομένων παρατίθεται στο τέλος του κειμένου όπου υπάρχει ο κώδικας και παρουσίαση των βοηθιτικών δεδομένων που θα χρησιμοποιθουν για να πετύχουμε την γεωναφοα τους. Όπως παρατηρείται τα δεδομένα εχουν διορθωθεί για τις εγγραφές “pre” (~νομός) και τις χώρες προέλευσης (country). Γενικά ο νομός ως γεωγραφική αναφορά εμφανίζει λιγότερες λανθασμένες εγγραφές αφού οι χρήστες σε γενικές γραμμές γνωρίζουν τον νόμο που διαμένουν όχι όμως απαραίτητα και τον Ταχυδρομικό Κώδικα της διευθυνσης που δηλώνουν. Λιγότερο αξιοπιστη είναι αναφορά στην οδό όπου η ονοματοδοσία και η αριθμοδοσία (όταν ή αν) γίνεται απο τους οργανισμούς της Τοπικης Αυτοιδιοικισης με χρονική και τοπική διασπόρα. Αποτελέσμα είναι να μην μπορούν να θεωρήθουν αξιόπιστα δεδομένα ακόμη και όταν συμπληρώνονται σωστά απο τον χρήστη.
Μετά την επεξεργασία των δεδομένων, που όπως προαναφέρθηκε ο τρόπος αναλύεται στο τέλος του κειμένου, ανακτούμε τα δεδομένα που συνοδέυουν το πακέτο και αφορούν τις αιτήσεις στο ΕΑΠ. Οι αιτήσεις έχουν ομαδοποιησθεί ανά χωρική περιοχή αναφοράς. Ας οπτικοποιησουμε κατα αρχήν τα δεδομένα όπως αρχικά xορηγήθηκαν με ένα απλό χωροπληθή χάρτη 5 τάξεων.
Αναναπαριστούμε τον αριθμό των αιτήσεων στα όρια του νομού γενικευοντας σε διαστήματα τόσα ώστε οι αποχρώσεις να διακρίνονται απο το χρήστης. Αυτός ο χάρτης όμως δημιουργεί εσφαλμένη εντύπωση στο χρήστη για 2 κυρίως λόγους. Καταρχήν σε καθε νομό φαίνεται ομοιογενής ο αριθμός των αιτουντων. Έτσι τα Κύθηρα φαίνεται να ανήκουν στην ίδια κατηγορία με την Αθήνα δηλαδή έχοντας αριθμό αιτήσεων μεταξύ 11000 και 350000. Το ίδιο βέβαια μπορεί να προκαλλέσει και η επιλογή της διαίρεσης σε 5 διαστήματα τιμών. Το πρώτο σφάλμα “οφείλεται”" στην “επιλόγή” της μονάδας απαρίθμισης (περίπου όρια νομού) και αυτό θα “διορθωθεί” με την χρήση των εργαλέιων που αναπτύχθηκαν.
data("EAP.application.pre_err")
dasymapPlot.leaflet(EAP.application.pre_err, 5)Με βάση τους διορθωμένους Ταχυδρόμικούς Κώδικές είναι δυνατό να δημίουργήσουμε μια “ρεαλιστικότερη” εικόνα για τις περιοχές που έγιναν οι αιτήσεις στο ΕΑΠ. Εδώ θα χρησιμοπoιήσουμε την πληροφορία του Ταχυδρομικού Κώδικα που μας επιτρεπει να έχουμε αναφορά των αιτούντων στα όρια του προ καποδιστριακού Δήμου. Αυτή η “ρεαλιστικότερη” απεικόνιση όπου η επιλογή της μονάδα απαρίθμισης (τώρα τα όρια του δήμου) έχει βελτιώση την απεικόνιση των δεδομένων. θα μπορούσε μάλιστα να συγκριθεί με το αποτέλεσμα της δασυμετρικής χαρτογραφίας που θα εφαρμόζουμε στην συνέχεια.
data("EAP.application.loc")
dasymapPlot.leaflet(EAP.application.loc, 2)